一直显示?点击任意区域即可关闭
文库
文章列表
全部分类
全部标签
可视化理解
标签
LLM
12
算法原理
8
LLM, DPO
1
vLLM
1
llamacpp
1
LLM, train
1
Tools
1
Agent
1
vue
1
前端
1
博客
主站
项目
Demo
Phimes
文库
文章列表
全部分类
全部标签
可视化理解
标签
0
LLM, train
1
LLM
12
算法原理
8
LLM, DPO
1
vLLM
1
llamacpp
1
LLM, train
1
Tools
1
Agent
1
vue
1
前端
1
更多
加载中...
技术总结
从什么都不会到QLoRA分布式DPO(二)
1 引言 之前已经知道最小化训练了。最小化确实是最小,一是没有日志去支撑分析,二是在单卡运行一个很小的模型在结果验证上也差强人意。 所以本文就如何验证模型训练效果以及量化配置两个方面,在原有代码基础上进一步展开。 2 什么是wandb wandb https://wandb.ai/ 是一个在线平台,...
LLM, train
3/7
1